实用RAG系统：从知识库到检索增强生成：超越训练截止点：为何大语言模型需要外部知识

大型语言模型可以流利地生成语言，但流畅性并不等同于事实可靠性。大语言模型的根本局限在于其对参数化记忆——即在训练结束时被冻结的知识，这一时间点被称为训练截止点。

RAG的存在是因为许多实际问题依赖于以下类型的信息：私有的、最新的、版本化的、领域特定的或可审计的。若缺乏外部知识，模型将面临以下问题：

开卷范式

与其通过昂贵的重新训练迫使模型‘记住’一切，不如将架构转向首先从外部语料库中检索特定证据，让大语言模型在看到证据的前提下作答。这带来了基于证据的信心而非无依据的信心。